期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于特定领域的中文微博热点话题挖掘系统BTopicMiner
李劲 张华 吴浩雄 向军
计算机应用    2012, 32 (08): 2346-2349.  
摘要1437)      PDF (725KB)(787)    收藏
随着微博应用的迅猛发展,自动地从海量微博信息中提取出用户感兴趣的热点话题成为一个具有挑战性的研究课题。为此研究并提出了基于扩展的话题模型的中文微博热点话题抽取算法。为了解决微博信息固有的数据稀疏性问题,算法首先利用文本聚类方法将内容相关的微博消息合成为微博文档;基于微博之间的跟帖关系蕴含着话题的关联性的假设,算法对传统潜在狄利克雷分配(LDA)话题模型进行扩展以建模微博之间的跟帖关系;最后利用互信息(MI)计算被抽取出的话题的话题词汇用于热点话题推荐。为了验证扩展的话题抽取模型的有效性,实现了一个基于特定领域的中文微博热点话题挖掘的原型系统——BTopicMiner。实验结果表明:基于微博跟帖关系的扩展话题模型可以更准确地自动提取微博中的热点话题,同时利用MI度量自动计算得到的话题词汇和人工挑选的热点词汇之间的语义相似度达到75%以上。
参考文献 | 相关文章 | 多维度评价
2. 基于社会标注质量的文本分类模型框架
李劲 张华 吴浩雄 向军 辜希武
计算机应用    2012, 32 (05): 1335-1339.  
摘要1065)      PDF (2726KB)(679)    收藏
社会标注是一种用户对网络资源的大众分类,蕴含了丰富的语义信息,因此将社会标注应用到信息检索技术中有助于提高信息检索的质量。研究了一种基于社会标注的文本分类改进算法以提高网页分类的效果。由于社会标注属于大众分类,标注的产生具有很大的随意性,标注的质量差别很大,因此首先利用文档间的语义相似度以及标注间的语义相似度来对标注的质量进行量化评估。在此基础上对标注进行质量过滤,利用质量相对较好的标注对文档向量空间模型进行扩展,将文档表示成由文档单词以及文档标注信息组成的扩展向量。同时采用支持向量机分类算法进行分类实验。实验结果表明,通过对标注进行质量评估并过滤质量差的标注,同时结合文档内容以及标注来对文档能提高分类的效果,同传统的基于文档内容的分类算法相比,分类结果的F1度量值提高了6.2%。
参考文献 | 相关文章 | 多维度评价
3. Web服务组合行为一致性的形式化描述和分析
李劲 张华 吴浩雄 向军
计算机应用    2012, 32 (02): 545-550.   DOI: 10.3724/SP.J.1087.2012.00545
摘要964)      PDF (931KB)(456)    收藏
Web服务编排和Web服务编制从全局和局部分别定义了Web服务组合的全局交互行为和每个参与者的局部行为,为了保证Web服务组合实现的正确性,Web服务组合的全局交互行为和每个参与者的局部行为必须是一致的。首先利用进程代数给出了对Web服务组合的全局交互行为、局部行为以及二者之间的映射关系的形式化描述,在此基础上分别通过分析全局会话变迁和局部进程变迁的关系和进程互相似理论给出了Web服务组合全局交互行为和局部行为的一致性的两个形式化判定准则。同时通过案例说明了如何形式化地检测Web服务组合的全局交互行为和局部行为之间的一致性。结果显示提出的Web服务组合一致性形式化定义和检测方法能检测组合行为的一致性,从而能有效地保证Web服务组合的正确性。
相关文章 | 多维度评价